علم دادهها به چه رشته و دانشی اشاره دارد؟
علم دادهها دانشی میان رشتهای است که فرآیندها، الگوریتمها و مدلهای مختلف را به کار میگیرید که از دل دادههای ساختارمند و غیر ساختارمند اطلاعات را استخراج کند، اطلاعات را پردازش و تحلیل کند و در نهایت بینشی قابل فهم در اختیار سازمانها و متخصصان قرار دهد. دقت کنید زمانیکه کاربرد درباره علم دادهها صحبت میکنیم، منظور ما تنها سازمانهای فناوری اطلاعات نیست، بلکه هر سازمانی در هر صنعتی میتواند از دادههای پالایش شده یا همان بینش کاربردی به منظور پیشبرد اهداف کلان خود استفاده کند. در حوزه تجارت این دانش میتواند در زمینه اخذ خطمشیها، ارزیابی فعالیتهای تجاری رقبا، شناسایی بازارهای هدف آینده، استمرار خط تولید یا متوقف کردن خط تولید یک محصول و موضوعات مشابه استفاده شود.
در حوزه بهداشت و صنعت بینش کاربردی میتواند در زمینه شناسایی بیماریها و نشانهها، کوتاهتر کردن چرخه تولید داروها و واکنسها، شناسایی ترکیبات متناقض دارویی که باعث مسمومیت کبدی میشوند استفاده شود. در حوزه وب و خدمات تعاملی طراحیهای سایتهای واکنشگرای هوشمند، پیشنهادات هوشمندانه بر مبنای سلایق کاربران، انجام خودکار برخی از وظایف، طراحی شبکههای هوشمندی که قادر به مدیریت خودکار ترافیک هستند و نرمافزارهای امنیتی که به شکل خودکار تهدیدات درون و برونسازمانی را شناسایی میکنند از مهمترین کاربردهای علم دادهها است. علم دادهها با تمرکز روی نقاطی که اطلاعات را تولید میکنند (شبکههای اجتماعی، وبلاگها، نقطه نظرات کاربران) دادههای خام را استخراج و به اطلاعاتی ارزشمند تبدیل میکند تا مشکلاتی که نیازمند تحلیلهای پیچیده هستند در کوتاهترین زمان حل شوند. بینش بهدست آمده ضمن آنکه در طراحی یک برنامه راهبردی کمک میکنند، ممکن است در مخازنی بهنام انبار داده (data warehouse) ذخیره شود تا برای آموزش مدلها و الگوریتمهای آینده استفاده شوند.
سازمانها و متخصصان در شرایط عادی به صرف زمان زیادی نیاز دارند تا حجم قابل توجهی از دادههای ساختارمند و غیر ساختارمند را برای شناسایی الگوهای مستتر در شبکههای اجتماعی و نقطه نظرات کاربران ارزیابی کنند، در حالی که علم دادهها به سازمانها کمک میکند هزینه انجام چنین کاری را کاهش داده و راندمان را افزایش دهند، فرصتهای رقابتی جدیدی در بازار به وجود آورند و به نسبت سازمانهایی که از رویکردهای سنتی برای شناسایی بازار و تعیین استراتژیهای تجاری استفاده میکنند در زمان کمتری مسیر درست را انتخاب کنند. به همین دلیل عناوینی همچون دانشمند علم دادهها، مهندس دادهها، مدیر دادهها، تحلیلگر دادهها و مهندس یادگیری ماشین به جذابترین مشاغل مرتبط با دنیای هوش مصنوعی تبدیل شوند.
دانشمند داده کیست؟
دانشمند داده فردی است که دانش کافی در زمینه آمار، احتمال و ریاضیات پیشرفته دارد. تخصص ویژه دانشمند داده در یک حوزه خاص، او را به یک تحلیلگر خبره در زمینه در زمینه دادهها تبدیل کرده است. دانشمند داده برنامهنویسی میداند و اطلاعات کافی در ارتباط با مدلسازی در حوزه یادگیری ماشین و هوش مصنوعی دارد.
مهندس داده کیست؟
یک مهندس داده (Data Engineer) در بیشتر موارد یک برنامهنویس است که با زبانهایی شبیه به پایتون، جاوا و اسکالا سروکار دارد. یک مهندس دادهها مهارت لازم در کار با سامانههای توزیع شده که برای تحلیل حجم بالایی از دادهها استفاده میشوند را دارد. به عبارت دقیقتر مهندس داده دانش کافی در ارتباط با بزرگ دادهها دارد و بر فرآیند استریم دادهها نظارت دارد. استریمی که از ابزارها و چارچوبهای بزرگ دادهها برای تحلیلهای بلادرنگ دادهها یا آماری استفاده میشود. یک مهندس داده در اغلب موارد در تیمی کار میکند که ابزارهای پردازش دادهها را تولید میکند. یک مهندس داده روی مولفهها و زیرساختهای قابل استفاده مجدد متمرکز است و در زمینه استخراج، تبدیل و آپلود دادهها و یکپارچهسازی سامانهها صاحب نظر است. فعالیتهایی که یک مهندس داده انجام میدهد پیرامون مدلهایی است که دانشمند داده آنرا ایجاد کرده و به یک سامانه تولیدی تبدیل کرده است. مهندس دادهها در زمینه ساخت و نظارت بر جریانهای داده هوش تجاری و همچنین انبار دادهها نیز به فعالیت اشتغال دارد.
مهندس یادگیری ماشین
مهندس یادگیری ماشین (Machine Learning Engineer) شغلی است که حد وسط دانشمند داده و مهندس داده است. به عبارت دقیقتر مهندس یادگیری ماشین فردی است که تخصصهای دانشمند داده و مهندس داده را دارد و به نوعی پوشش دهنده ضعفهای دو تخصص یاد شده است. این فرد سطح بالایی از مهارتهای برنامهنویسی را به نسبت دانشمند داده و سطح بالاتری از مهارتهای تحلیل دادهها را در مقایسه با مهندس داده دارد. مهندس یادگیری ماشین وظیفه بهینهسازی برنامهها و سامانههای مبتنی بر یادگیری ماشین را عهدهدار است. این فرد در یک تیم متشکل از متخصصان دادهها روی نوع خاصی از یادگیری ماشین، رویکردها و ابزارها متمرکز است و همواره سعی میکند نوع جدیدی از مدلها را توسعه دهد.
مدیر دادهها
مدیر دادهها (Data Manager) عمدتا یک نقش مدیریت است که سعی میکند بر اجرای درست عملیات و استفاده بهینه و مطلوب از دادهها نظارت کند. این فرد بر فرآیند یکپارچهسازی موثر فرآیند مدیریت دادهها با سایر فرآیندها با هدف ارائه سرویسهای مطلوب نظارت دارد. تهیه نسخه پشتیبان و بازیابی اطلاعات، ارتقای استانداردها، رویهها و فناوریهایی که به منظور تهیه نسخه پشتیبان استفاده میشوند و همچنین تهیه گزارشهایی که باید آماده شوند نظارت میکند.
معمار دادهها
معمار دادهها (Data Architect) مسئولیت طراحی، ساخت، استقرار و مدیریت معماری دادهها در یک سازمان را عهدهدار است. معمار دادهها بر روند چگونگی ذخیرهسازی، بهکارگیری، یکپارچهسازی و مدیریت دادهها توسط موجودیتهای مختلف و سامانههای فناوریاطلاعات نظارت دارد. این فرد باید مطمئن شود که سازمان در چارچوب یک استاندارد معتبر از دادهها استفاده میکند و معماری دادهها همسو با اهداف کسبوکار استفاده میشوند. این فرد همچنین بر پایگاههای دادهها نظارت داشته و سعی میکند یک فرآیند بهینهسازی را روی منابع داده بهکار گیرد.
تحلیلگر دادهها
تحلیلگر دادهها (Data Analyst) مسئولیت تفسیر و تبدیل دادهها به اطلاعات را عهدهدار است و سعی میکند راههایی را برای بهبود فرآیندهای تجاری ابداع کند. تحلیلگر دادهها باید دادهها را از منابع مختلف جمعآوری کرده، الگوها و روندهای موجود در دادهها را تحلیل کند. زمانی که دادهها جمعآوری و تحلیل شدند، تحلیلگر دادهها باید دانش استخراج شده را با سایر کارمندان بهاشتراک قرار گرفته و گزارش خود را در اختیار مدیران ارشد سازمان قرار دهد. این فرد سعی میکند توصیهها و پیشنهادهایی را در ارتباط با روشها و راهکارهایی که باعث میشود فرآیندهای تجاری و عملکرد سامانهها بهبود پیدا کند ارائه میکند. در حالت کلی سازمانها انتظار دارند تحلیلگر دادهها در زمینه جمعآوری و تفسیر دادهها، تحلیل نتایج، گزارش نتایج به مدیران و سایر همکاران، شناسایی الگوها و رویههای موجود در مجموعه دادهها و کار کردن با تیمهای کسبوکار و مدیریتی به منظور پاسخگویی به نیازهای تجاری تجربه و مهارت کافی را داشته باشد. طبیعی است که تحلیلگر دادهها باید در حوزههای ریاضی، علوم کامپیوتر، آمار، احتمال و اقتصاد دانش بالایی داشته باشد.
به این مطلب چند ستاره میدهید؟(امتیاز: 1.1 - رای: 6)
- منبع: ماهنامه شبکه
- نویسنده: حمیدرضا تائبی